智能论文笔记

Predicting probability distributions for cancer therapy drug selection optimization

Jarek Duda

分类：机器学习

2022-09-13

细胞系之间的巨大差异给癌症治疗的药物选择问题带来了困难的优化问题。标准方法为此目的使用价值预测，例如达到其分布的预期价值。本文显示了工作的优势，预测了整个概率分布 - 为此目的提出了基本工具。我们对要测试的最佳药物非常感兴趣 - 正确优化其对极端统计的选择需要了解整个概率分布，这些分布对于在细胞系中的药物特性分布通常会变成二项式，例如。取决于相应的基因。因此，对于基本的预测机制，提出了两个高斯人的混合物，试图根据其他信息来预测其体重。

translated by 谷歌翻译

Low cost prediction of probability distributions of molecular properties for early virtual screening

Jarek Duda , Sabina Podlewska

分类：机器学习

2022-07-21

尽管一般关注对价值的预测，但在数学上更合适的是概率分布的预测：诸如预测不确定性，更高的矩和分位数之类的其他可能性。出于计算机辅助药物设计领域的目的，本文采用了层次相关重建方法，以前应用于人口，财务和天文数据的分析。它不是单个线性回归来预测值，而是使用多个线性回归来独立预测多个矩，最终将它们结合到预测的概率分布中，这里基于Klekota \＆Roth开发的几个ADMET属性。讨论的应用示例是在虚拟筛选过程中廉价地选择具有属性几乎确定在预测或选择范围内的分子的廉价选择。这种方法可以促进结果的解释，因为自动检测到以高不确定性为特征的预测。此外，对于每个研究的预测问题，我们都检测到了关键的结构特征，在优化针对特定特性的化合物时，应仔细考虑这些特征。因此，研究中开发的整个方法构成了对药物学家的大力支持，因为它可以快速排斥所需的理化/ADMET特征最低潜力的化合物，并指导化合物优化过程。

translated by 谷歌翻译

Predicting conditional probability distributions of redshifts of Active Galactic Nuclei using Hierarchical Correlation Reconstruction

Jarek Duda

分类：机器学习

2022-06-13

尽管一般关注值的预测，但实际数据通常只允许预测有条件的概率分布，并且有条件熵$ H（y | x）$的功能。如果另外估计不确定性，我们可以将预测的值视为拉普拉斯分布的高斯中心 - 理想化可能远非真实数据的复杂条件分布。本文应用层次相关重建（HCR）方法来廉价地预测相当复杂的条件概率分布（例如多模式）：通过独立的MSE估计多动力矩状参数，可以重建条件分布。为此，使用线性回归，我们获得了可解释的模型：带有描述特征对条件矩的贡献的系数。本文扩展了原始方法，尤其是通过使用规范相关分析（CCA）进行特征优化和L1“ Lasso”正则化，重点是基于第四个Fermi-LAT数据释放2的活动的活性银河核（AGN）预测的实际问题。（4LAC）数据集。

translated by 谷歌翻译

Improving SGD convergence by online linear regression of gradients in multiple statistically relevant directions

Jarek Duda

分类：机器学习 | (统计)机器学习

2019-01-31

Deep neural networks are usually trained with stochastic gradient descent (SGD), which minimizes objective function using very rough approximations of gradient, only averaging to the real gradient. Standard approaches like momentum or ADAM only consider a single direction, and do not try to model distance from extremum - neglecting valuable information from calculated sequence of gradients, often stagnating in some suboptimal plateau. Second order methods could exploit these missed opportunities, however, beside suffering from very large cost and numerical instabilities, many of them attract to suboptimal points like saddles due to negligence of signs of curvatures (as eigenvalues of Hessian). Saddle-free Newton method is a rare example of addressing this issue - changes saddle attraction into repulsion, and was shown to provide essential improvement for final value this way. However, it neglects noise while modelling second order behavior, focuses on Krylov subspace for numerical reasons, and requires costly eigendecomposion. Maintaining SFN advantages, there are proposed inexpensive ways for exploiting these opportunities. Second order behavior is linear dependence of first derivative - we can optimally estimate it from sequence of noisy gradients with least square linear regression, in online setting here: with weakening weights of old gradients. Statistically relevant subspace is suggested by PCA of recent noisy gradients - in online setting it can be made by slowly rotating considered directions toward new gradients, gradually replacing old directions with recent statistically relevant. Eigendecomposition can be also performed online: with regularly performed step of QR method to maintain diagonal Hessian. Outside the second order modeled subspace we can simultaneously perform gradient descent.

translated by 谷歌翻译

Learning-Based Radiomic Prediction of Type 2 Diabetes Mellitus Using Image-Derived Phenotypes

Michael S. Yao , Allison Chae , Matthew T. MacLean , Anurag Verma , Jeffrey Duda , James Gee , Drew A. Torigian , Daniel Rader , Charles Kahn , Walter R. Witschey

分类：机器学习 | 人工智能

2022-09-20

2型糖尿病（T2DM）的早期诊断对于及时的治疗干预措施和生活方式改变至关重要。随着医学成像数据在许多患者群体中变得更广泛可用，我们试图研究是否可以在表格学习分类器模型中利用图像衍生的表型数据来预测T2DM的发病率，而无需使用侵入性血液实验室测量。我们表明，使用图像衍生表型的神经网络和决策树模型都可以预测患者T2DM状态的召回评分高达87.6％。我们还提出了与“ Syntha1c编码器”相同的结构的新颖使用，这些结构能够输出模仿血液血红蛋白A1C经验实验室测量值的可解释值。最后，我们证明了T2DM风险预测模型对输入矢量成分中小扰动的敏感性可用于预测从以前看不见的患者人群中取样的协变量的性能。

translated by 谷歌翻译

The Face of Affective Disorders

Christian S. Pilz , Benjamin Clemens , Inka C. Hiss , Christoph Weiss , Ulrich Canzler , Jarek Krajewski , Ute Habel , Steffen Leonhardt

分类：计算机视觉

2022-08-02

我们研究了精神病学临床领域中脑唤醒的调节改变了面部行为的统计特性。潜在的机制与对某些心理状态的行为替代测量的警惕性连续体的经验解释有关。我们以基于经典的头皮的审视传感器（OEG）的意义命名了所提出的测量，该传感器光电脑摄影（OEG）仅依赖于现代基于摄像机的实时信号处理和计算机视觉。基于随机表示作为面部动力学的连贯性，反映了情绪表达中的半径不对称性，我们证明了患者与健康对照之间几乎没有完美的区别，以及精神疾病抑郁症和精神分裂症和症状的严重性。与标准诊断过程相反，该过程耗时，主观，不包含神经生物学数据，例如实时面部动力学，情感响应能力的客观随机建模仅需要几分钟的基于视频的面部录制。我们还强调了该方法作为因果推断模型在转诊分析中的潜力，以预测药理治疗的结果。所有结果均在临床纵向数据收集中获得，其中有100名患者和50例对照。

translated by 谷歌翻译

Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

Michael Ahn , Anthony Brohan , Noah Brown , Yevgen Chebotar , Omar Cortes , Byron David , Chelsea Finn , Chuyuan Fu , Keerthana Gopalakrishnan , Karol Hausman

分类：机器人 | 自然语言处理 | 机器学习

2022-04-04

大型语言模型可以编码有关世界的大量语义知识。这种知识对于旨在采取自然语言表达的高级，时间扩展的指示的机器人可能非常有用。但是，语言模型的一个重大弱点是，它们缺乏现实世界的经验，这使得很难利用它们在给定的体现中进行决策。例如，要求语言模型描述如何清洁溢出物可能会导致合理的叙述，但是它可能不适用于需要在特定环境中执行此任务的特定代理商（例如机器人）。我们建议通过预处理的技能来提供现实世界的基础，这些技能用于限制模型以提出可行且在上下文上适当的自然语言动作。机器人可以充当语言模型的“手和眼睛”，而语言模型可以提供有关任务的高级语义知识。我们展示了如何将低级技能与大语言模型结合在一起，以便语言模型提供有关执行复杂和时间扩展说明的过程的高级知识，而与这些技能相关的价值功能则提供了连接必要的基础了解特定的物理环境。我们在许多现实世界的机器人任务上评估了我们的方法，我们表明了对现实世界接地的需求，并且这种方法能够在移动操纵器上完成长远，抽象的自然语言指令。该项目的网站和视频可以在https://say-can.github.io/上找到。

translated by 谷歌翻译

Emergence of hierarchical reference systems in multi-agent communication

Xenia Ohmer , Marko Duda , Elia Bruni

分类：人工智能 | 自然语言处理

2022-03-24

在自然语言中，在不同级别的特异性中引用对象是在上下文中有效沟通的基本务实机制。我们开发了一个新颖的沟通游戏，即层次参考游戏，以研究人造代理中这种参考系统的出现。我们考虑了一个简化的世界，其中概念是一组原始属性（例如颜色，样式，形状）的抽象。根据组合数量的属性，概念更一般（“圆”）或更具体的（“红色虚线圆”）。基于上下文，代理必须在该层次结构的不同级别进行交流。我们的结果表明，代理商学会了成功玩游戏，甚至可以推广到新颖的概念。为了获得抽象，他们使用隐式（省略无关信息）和明确（表明属性是无关紧要的）策略。此外，概念层次结构基础的组成结构反映在紧急协议中，表明开发层次参考系统的需求支持组成性的出现。

translated by 谷歌翻译